XX. mendeko Euskararen Corpus estatistikoa

Testuingurua

Hurrengo blokean erregresioaren ekuazioa agertzen da. Lehenengo zutabean erregresio-ekuazioaren parametroen estimazioak daude eta hemendik gure erregresio-ekuazioa lor dezakegu.

FRUSTRAZ = -18.01 + 1.06ÀNTSIETA + 4.05*MAILASOZ + 36*TELEBIS1

Ekuazio honetatik abiatuz, FRUSTRAZen aurresanak egin ditzakegu.

Demagun pertsona baten aldagaien balioak hauek direla: ANTSIETA = 70 TELEBIS1 = 15 MAILASOZ = 3

Pertsona honen FRUSTRAZ aldagaiarentzat egingo dugun aurresana hau izango da: FUSTRAZ = -18.01 + 1.06*70 + 4.05*3 + .36*15 = 73.74

Aurresana 73.74 litzateke eta aurresan honen baliozkotasuna, determinazio- edo mugatze-koefizienteak emango digu.

Aurresan hau FRUSTRAZ aldagaiaren % 94.11 kontrolatzen dugularik egiten dugu. Oraindik % 5.89 kontrolatu edo esplikatu gabe daukagu, eta honek hanka sartzeko bidea ematen digu.

10.5.1. Aldagai askeen aukeraketa. Ekuazioa osatzeko metodoak

Orain arte erregresioan lortzen ziren emaitzak aztertzen saiatu gara, eta lortzen dugun hurbiltasuna handia ala txikia den determinazio- edo mugatze-koefizientea erabiliz ikusi dugu.

Erregresio-ekuazioen helburu garrantzitsuetako bat R2 balio gorena lortzea izango da.

Balio hau handitzeko erabiltzen den metodoetako bat ekuazio barruan aldagai gehiago sartzea izango da.

Baina batzuetan hau ez dela nahikoa izango ikusiko dugu, aldagai aske berria, menpeko aldagaia esplikatzen duena, lehendik ekuazioan ditugun aldagaiek ia esplikatuta eduki dezaketelako.

Bosgarren aldagaitik aurrera oso kasu gutxitan handituko da determinazio-koefiziente.

Bestalde, ekuazio barruan zenbat eta aldagai gehiago sartu orduan eta zailagoa izango da emaitzak interpretatzea.

SPSSWIN paketeak, orain arte aipatu ditugun arrazoiak kontuan hartuta, aldagaiak ekuazioan sartzeko 5 metodo diferente erabiltzeko aukera ematen digu. Metodoak hauek dira:

1.- INTRODUCIR: (ENTER). Sinpleena da hau. Metodo honetan, aldagai aske guztiak batera sartzen dira ekuazioan. Aurreko adibidean erabili duguna da.

2.- PASOS SUCESIVOS. STEPWISE ere deitua. Agian hau da gehien erabiltzen dena; nahiz eta prozesuaren bukaeran (batzuetan) INTRODUCIR metodoaren emaitza berdinak lortu, bidean jasotako informazioa aberatsagoa da.

Esan beharra dago etapakako metodoa dela; hau da, metodo honetan, aldagai guztiak ez dira denak batera sartzen ekuazioan, banan-banan baizik.

Ekuazioan sartzen den lehenengo aldagai askea, menpeko aldagaiarekiko korrelazio handiena duena izango da.

Aldagai honekin kalkulu guztiak egin eta azaldu ondoren, bigarren aldagaia sartuko du.

Bigarren aldagai hau sartzean, korrelazio-koefiziente partzialak hartzen ditu kontuan.

Hau da, lehenengo pausoan kanpoan gelditu diren aldagai askeen eta menpekoen arteko korrelazio-koefiziente partzialak kalkulatzen ditu, ekuazio barruan dagoen aldagaiaren eragina baztertuz.

Hau da, bigarren aldagaia ekuazioan sartzean komeni da, sartuko den aldagaiak menpeko aldagaien bariantzaren ahalik eta portzentaia handiena esplikatzea, baina ekuazio barruan jada dagoenak esplikatzen ez duena izatea.

Beraz, hau da korrelazio-koefiziente partzialak adierazten duena, eta horregatik erabiliko dugu ekuazioan zein aldagai sartuko den erabakitzeko.

Bigarren aldagaia zein izango den erabaki ondoren, berriz kalkulu guztiak egin eta azaldu egiten ditu.

Hirugarren aldagaia sartuko du ekuazioan.

Hirugarren aldagaia sartzean ere, orain arte kanpoan gelditu diren aldagai aske eta menpekoen, arteko korrelazio-koefiziente partzialak kalkulatzen ditu, ekuazio barruan sartuta dauden aldagaien eragina baztertuz, eta horrela jarraitzen du prozesua amaitu arte.